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Abstract 

This Note presents original rates of convergence for the deconvolution problem. We assume that both the estimated 
density and noise density are supersmooth and we compute the risk for two kinds of estimators. 

Resume 

Vitesses de convergence en deconvolution nonparametrique. Cette Note presente des vitesses de conver- 
gence originales pour le probleme de deconvolution. On suppose que la densite estimee ainsi que la densite du 
bruit sont « supersmooth » et on calcule le risque pour deux types d'estimateurs. 



Version frangaise abregee 

On considere le probleme de deconvolution suivant : 

Xi + Ei i = 1, . . . ,n 

oil les Xi sont des variables aleatoires independantes et identiquement distribuees de densite inconnue g 
et les variables aleatoires Si sont i.i.d de densite connue f^. Les suites {Xi) et [si) sont de plus supposees 
independantes. L'objectif est d'estimer g a partir des donnees Yi, . . . , V„. 

Le cadre d'hypotheses est le suivant. Notons, pour toute fonction u, u* la transformee de Fourier de 
u : u*{x) — J e^^^u{t)dt. On suppose que le bruit est tel que pour tout x de R, f^{x) 7^ ct qu'il satisfait 
Fhypothese suivante : 

Nl. II existe s > 0, 5 > 0, 7 e M (7 > si s ^ 0) et ko, ki > tels que 

ko{x^ + l)-T/2exp(-6|xn < < ki{x^ + 1)-'^^ exp{-b\xn 
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On suppose de plus que g appartient a I'espace 



As,rAL) = {g densite sur M et / \g*{x)\'^{x^ + if exp(2a|a;|'') < L} 



avec r > 0, a > 0, (5 G M (5 > 1/2 si r = 0), L > 0. Lorsque r est strictement positif, la fonction est dite 
superreguliere et ordinairement reguliere sinon, la terminologie etant la meme pour le bruit. 

Cc problcmc a etc largcmcnt ctudie pour une fonction g appartenant a un cspacc dc Sobolcv ou de 
Holder (i.e. r = 0) : on peut citer entre autres [3], [5], [6,7], [8], [10]. Les vitesse de convergences mediocres 
(en puissances de In n) obtenues lorsque le bruit est superregulier (et en particulier pour les distributions 
gaussicnncs) ont conduit a considcrcr dcs fonctions g egalcmcnt supcrregulieres. En premier [9] et plus 
recemment [1], [2] et [4] ont etudie des estimateurs dans ce contexte. 

Dans cette Note, nous fournissons des vitesses de convergence exactes et explicites, meme dans le cas 
r > 0, ,s > pour Icqucl jusqu'a maintc;nant les vitcsscs n'ctaicnt donnees que dc fagon implicite, excepte 
dans des cas tres particuliers. Ces vitesses sont calculees pour deux types d'estimateurs. 

L'estimateur a noyau classique est le suivant : 



ou K est dcfini comme la transformee de Fourier inverse de K*{x) = l{|a;|<i}//*(a;//i). Le risque ponctuel 
(note MSE) et le risque integre (notee MISE) sont etablis dans [2] (voir la proposition 2.1 ci-dessous). 
Get estimateur a I'avantage d'etre optimal au sens minimax asymptotique fin (voir [2]) mais ne fournit 
d'estimateur adaptatif que dans des cas particuliers. C'est pourquoi nous nous interessons egalement a 
l'estimateur de projection introduit dans [4]. 



Soit Lp{x) = sin(7ra;)/(7ra;) et fmjix) = V Lm<f{LmX — j)- En posant Ut(x) = (l/27r)(t*(— a;)//*(a;)), 

l'estimateur de projection est defini par 



Pour cet estimateur, le calcul du rique integre est presente dans [4] (voir la proposition 2.2 ci-dessous). 
Un estimateur adaptatif peut ensuite etre defini en utilisant une technique de selection de modeles (voir 
[4] pour les details). 

On peut observer que les deux estimateurs ont les memes vitesses de convergence, qui s'obtiennent en 
minimisant I'ordre du risque. On est alors ramene a resoudre I'equation suivante 



ou a = r — 2^ — 27 — 1 lorsque Ton considere I'erreur integree et a = —25 — 27 + (s — 1)+ lorsque Ton 
considere I'erreur ponctuelle. Dans la plupart des cas, la solution de cette equation est bien connue (voir 
Tables 1 et 2). Seul le cas r > 0, s > n'a pas ete completement resolu. C'est ce cas qui est etudie ici : 
les vitesses sont donnees explicitement dans le theoreme 3.1. 

Trois cas sont a differencier : r = s, r < s et r > s. Si r est egal a s, les vitesses (ponctuelles et integrees) 
sont en n~"/^"+'') modifiees par un facteur logarithmique. Si r est different de s, on observe un phenomene 
original : les vitesses dependent de I'intervalle ]k/{k + 1), [k + l)/{k + 2)\,k € N auquel appartient r/s 
ou s/r. Si r est strictement inferieur a s (biais dominant), le terme principal est d'ordre exp[6o(lnn)''/*] 
avec 60 = — 2a/(26)'"/^, et si r est strictement superieur a s (variance dominante), le terme principal est 
d'ordre exp[— rfo(lnn)*/'']/n avec do = -26/(2a)"/^ 

Ainsi ces vitesses originales decroissent plus vite que n'importe quelle fonction logarithmique. De plus 
elles sont optimales lorque les bornes inferieures correspondantes sont connues, c'est-a-dire r = s = 1 






exp(- + -W = 0{n) 
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(voir [11]) et r < s (voir[2]). II est a noter qu'etant donne la complexite de ces vitesses, il est reellement 
interessant de construire des estimateurs adaptatifs, c'est-a-dire des estimateurs dont le risque atteint 
automatiquement les vitesses minimax. 



1. Introduction 



We consider the following deconvolution problem: 



Yi — Xi + £i 



i = 1, . . . , n 



where the Xi's are independent and identically distributed random variables with an unknown density 
g and the random variables Si are i.i.d with known density f^. Moreover (Xi) and (sj) are independent. 
The aim is to estimate g from data Yi, . . . , Y„. 

The hypothesis framework is the following. Denote, for all function u, u* the Fourier transform of u: 
u*{x) = J e^^*u{t)dt. We suppose that noise is such that for all x in M, f*{x) ^ and that it satisfies the 
following assumption: 

Nl. There exist s > 0, 6 > 0, 7 e M (7 > if s = 0) and k^, fci > such that 



with r>0,a>0, (5eM((5>l/2ifr = 0),L>0. When r > the function is known as supersmooth, 
and as ordinary smooth else. The terminology is the same for noise. 

This problem has been extensively studied for a function g belonging to a Sobolev or Holder class 
(i.e. r = 0): see among others [3], [5], [6,7], [8], [10]. The bad rates of convergence (power of Inn) 
for supersmooth noise (and then in particular for Gaussian distributions) lead to consider supersmooth 
functions. First [9] and more recently [1], [2] and [4] studied estimators in this context. 

The contribution of this paper is to provide exact and explicit rates of convergence, even in the case 
r > and s > where up to now the rates were not explicitly available except in very particular cases. 



2. Estimators and preliminar results 
2.1. Estimators 

The classical kernel estimator is the following: 



where K is the function defined as the inverse Fourier transform of K*{x) = t^\x\<i}/ .f*{x/h). The 
pointwise mean squared error (denoted by MSE) and mean integrated squared error (denoted by MISE) 
are established in [2]: 



ko{x^ + l)-^/^eM-bK) < \f;{x)\ < ki{x^ + l)-T/2exp(-fe|a:|^) 



We assume that g belongs to the space 



-4(5,r,a(-f') = {5 is a probability density on M and / \g*{x)\'^{x^ + 1)* exp(2a|a;|'') < L} 
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Proposition 2.1 If g belongs to As,r,a{L), then under Assumption Nl, 

MISE = E\\g - g4l = O ih'^^ exp(-2a//i'-) + exp(26//i*) and 

( /i^-i-^-)- \ 
USE = E\g{x) - 5„(a;)|2 = O I /i^'^+'-i exp(-2a//i'-) + min(l, h'-'^) exp{2b/h') 

This estimator has the advantage to be optimal in the sharp asymptotic minimax sense (see [2]) but 
provides an adaptive estimator only in particular cases. That is why we present the projection estimator 
introduced in [4]. 

Let (p{x) = sm{Trx) / {it x) and (pm,j{x) = \/L^ip{LmX — j). Consider ut{x) = {l/2'K){t*{—x)/f*{x)). 
Then the projection estimator is defined by 

1 " 

9m{x) = ^ amjVmj where dmj = - -»^^ , (^i) 

\j\<K^ '=1 

For this estimator, the following result is proved in [4]: 

Proposition 2.2 Assum,e that fe G (i.e. 7 > 1/2 when s = 0) and that g is a function which 
verifies J x^g'^{x)dx < M. If g belongs to As,r,a{L), then under Assumption Nl, 

( ^27+1-8 \ 

MISE = E\\g -gm\\l = Ol L'^* exp(-2a7r'-L^) + ^ exp(267r«L^) J 

Then, an adaptive estimator can be defined using a model selection method (see [4] for details). 



2.2. Rates of convergence 

We can observe that both estimators have the same rate of convergence (take h~^ = TrLm). To 
compute this rate, we have to minimize the risk orders in h (or Lm)- By setting to zero the derivative of 
this quantity we obtain the equation 

exp(| + |^)/i"=0(n) (1) 

where a = r — 2(5 — 27 — 1 if we consider the integrated error and a ~ —2S — 27 + (s — 1)+ if we consider 
the pointwise error. In most cases, the solution of this equation is well known and leads to the following 
tables where different regularities for g and are examined: 



s > 



s = 



i- > 





is 


25 




1-5* 


1-25 


r = 


n 2d+27+l 


(In n) a 


r = 




(In n) a 


r > 


'J-y + l 

(In n) r 
n 


Theorem 3.1 


r > 


(In n) r 
n 


Theorem 3.1 



Table 1 

Rates of convergence for the MISE. 



Table 2 

Rates of convergence for the MSE. 



Except for the bottom right cells (to be completed in the next section), these rates are known to be 
optimal minimax rates: see [6] and [1] for the lower bounds. 
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3. Results 



The rates of convergence in the case (r > 0, s > 0) depend on the integer k such that r/s or s/r belongs 
to the interval {k/{k + 1), (fc + l)/(fc + 2)]: 

Theorem 3.1 We assume r > and s > 0. Let A; € N and X = = r/s. Then 
• ifr = s,if^= [26b + {s - 2j - l)a]/[{a + b)s] 



MISE = O (In n)-«) ; 

MSE = O ^n""/("+''^(lnn)"«+^T^ 



k k + 1 
if r < s and < A < , there exist reals 6, such that 



MISE = ^(lnn)-2'^/*exp[^6i(lnn)('+i)^-']^ ; 



MSE = O ( (lnn)(-2^-''+i)/*exp[^6,(lnn)(*+^)^-*] 
k k + 1 



i=0 



• if r > s and < w < -; -, there exist reals di such that, 

k + 1 k + 2 



MISE = O exp[- dr{\nn)^'+^^^' 



i=0 



MSE = O exp[- J2 rfi(lnn)('+i)''-*] 

The coefficients bi and di are computable, see Section 4 for the exact form of reals bi. Notice that 
these original rates have the property to decrease faster than any logarithmic function. Moreover, they 
arc optimal in the cases where the corresponding lower boimds arc known, i.e r = s = 1 (sec [11]) and 
r < s (see [2]). We can also remark that, given the complexity of these rates, it is woth finding adaptive 
estimators, i.e. estimators whose risk automatically achieves the minimax rates. 



4. Proof of Theorem 3.1 

• If r = s, wo check that h* = (2a+26)^/* (inn + - Inlnn) satisfies Equation (1). The corresponding 

risks are easily obtained. 

k A; + 1 

• If r < s and - — -< A < - — -, let h* = (26)i/'*[lnn + f Inlnn + E^^o 6i(lnn)(*+^)-^-*]-i/'* 

r25 2A , , 2a , A(A- 1)..(A- fc) , fc,,,, 

^Mj^ + j^+alnh*]= ifnexp[^(lnn)^(l + A«„ + .. + ^^^^l^, ^w^^ + o{u'^+')) 

k 

+ V 6.(lnn)('+^)^-* - - ln(l + o(l))] 
U ' 

5 



with n„ := f i2i^ + Eto 6i(lnn)(^+i)^-(^+i) 

By noting that for 2 < j < fc + 1, < = E-=/ Ep,+..+p,=i 6j,,_i..6p,_i(lnn)(^-i)' + o((lnn)(^-i)('=+i)), 
we compute 

exp[-^ + j^+alnh*] = i^nexp[o(l) + ^M,(lnn)('+i)^-' + o((lnn)('=+2)^-('=+i))] 

2a 2a * A...(A-j + l) ^ 
with Mo = bo + J— J and tor 1 < i < k + 1, Mi = bi + ——^ } ^ ^ bp^-i..bp^-i 

^ ' ^ ' j=i pi+..+p,=i 

by denoting b^+i = 0. The bi's are recursively defined by Mq = ... = = and thus Equation (1) is 

verified. The risks are then computed by using the same tools. 

• The reasoning is the same in the case r > s 
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